AI资讯新闻榜单内容搜索-大模型

动态RAG性能提升14个点！用4万亿token教会大模型「什么时候该检索」

近日，来自伊利诺伊大学芝加哥分校、纽约大学、与蒙纳士大学的联合团队提出QuCo-RAG，首次跳出「从模型自己内部信号来评估不确定性」的思维定式，转而用预训练语料的客观统计来量化不确定性，

来自主题: AI技术研报

7859 点击 2026-01-01 10:13

最像 Anthropic 的中国 AI 公司，是MiniMax

“中国的OpenAI” 是谁？一众媒体和分析机构给出的答案是：智谱。家中国的大模型 AI 创业公司正在港交所冲刺 IPO。在招股说明书中，它明确宣称：“2025年6月，智谱被美国OpenAI 列为全球主要竞争对手。”

来自主题: AI资讯

7470 点击 2025-12-22 17:08

100万亿Token揭示真相：中国开源AI拿下30%全球份额，推理已成主流

之前我在这篇文章(超全面免费 AI API 分享！零成本开启你的AI之旅！)中介绍过 OpenRouter 这个大模型 API 聚合平台，最近他们通过分析了100 万亿 token用户真实数据，发布了一篇研究报告，反应了真实用户的大模型使用现状。100 万亿 token 是什么概念呢？是人类所有文字资料的好几倍，这个数据量非常有说服力。

来自主题: AI技术研报

5953 点击 2025-12-22 17:05

大模型「有心了」：首个情感大模型Echo-N1，32B胜过200B

近日，来自 NatureSelect（自然选择）的研究团队 Team Echo 发布了首个情感大模型 Echo-N1，提出了一套全新的「情感模型训练方法」，成功将 RL 用在了不可验证的主观情感领域。仅 32B 参数的 Echo-N1，在多轮情感陪伴任务中胜率（Success Rate）达到 46.7%。作为对比，

来自主题: AI资讯

7814 点击 2025-12-10 14:38

Percept-WAM：真正「看懂世界」的自动驾驶大脑，感知到行动的一体化模型

近日，来自引望智能与复旦大学的研究团队联合提出了一个面向自动驾驶的新一代大模型 ——Percept-WAM（Perception-Enhanced World–Awareness–Action Model）。该模型旨在在一个统一的大模型中，将「看见世界（Perception）」「理解世界（World–Awareness）」和「驱动车辆行动（Action）」真正打通，形成一条从感知到决策的完整链路。

来自主题: AI技术研报

6190 点击 2025-12-10 14:33

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

近日，第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告，国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现，在模型榜单中名列第一，体现了基于国产昇腾算力的大模型研发实力。

来自主题: AI资讯

7787 点击 2025-12-06 11:23

罗福莉C位亮相小米，离职DeepSeek后首次官宣

就在今天，罗福莉以C位之姿，首次对外官宣了小米任职。刚刚，罗福莉在X上高调宣布——正式加入小米，出任MiMo团队负责人。智能的进化必然会从语言世界走向物理世界，解锁多模态的空间智能——具备感知、推理、生成与行动的能力，这是实现真正通用人工智能（AGI）的关键一步。

来自主题: AI资讯

8096 点击 2025-11-12 19:07

清北联合推出Motion Transfer，比肩Gemini Robotics，让机器人直接从人类数据中端到端学习技能

近期，Google DeepMind 发布新一代具身大模型 Gemini Robotics 1.5，其核心亮点之一便是被称为 Motion Transfer Mechanism（MT）的端到端动作迁移算法 —— 无需重新训练，即可把不同形态机器人的技能「搬」到自己身上。不过，官方技术报告对此仅一笔带过，细节成谜。

来自主题: AI技术研报

8269 点击 2025-11-05 16:39

大模型 “准确率悬崖” 被证实，科学家发现模型单次处理容量上限，多智能体成破局关键

近日，来自阿联酋穆罕默德·本·扎耶德人工智能大学 MBZUAI 和保加利亚 INSAIT 研究所的研究人员发现一个针对大模型单次推理的“法诺式准确率上限”，借此不仅揭示了单次生成范式的根本性脆弱点，也揭示了“准确率悬崖”这一现象。

来自主题: AI技术研报

7918 点击 2025-10-20 14:02

RL 将如何提高具身大模型 VLA 泛化性？清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

在具身智能领域，视觉 - 语言 - 动作（VLA）大模型正展现出巨大潜力，但仍面临一个关键挑战：当前主流的有监督微调（SFT）训练方式，往往让模型在遇到新环境或任务时容易出错，难以真正做到类人般的泛化

来自主题: AI技术研报

8853 点击 2025-10-13 10:28

AI资讯新闻榜单内容搜索-大模型

动态RAG性能提升14个点！用4万亿token教会大模型 「什么时候该检索」

最像 Anthropic 的中国 AI 公司，是MiniMax

100万亿Token揭示真相：中国开源AI拿下30%全球份额，推理已成主流

大模型「有心了」：首个情感大模型Echo-N1，32B胜过200B

Percept-WAM：真正「看懂世界」的自动驾驶大脑，感知到行动的一体化模型

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

罗福莉C位亮相小米，离职DeepSeek后首次官宣

清北联合推出Motion Transfer，比肩Gemini Robotics，让机器人直接从人类数据中端到端学习技能

大模型 “准确率悬崖” 被证实，科学家发现模型单次处理容量上限，多智能体成破局关键

RL 将如何提高具身大模型 VLA 泛化性？清华大学团队NeurIPS 2025文章分析 RL 与 SFT 泛化性差异

动态RAG性能提升14个点！用4万亿token教会大模型「什么时候该检索」